OpenAI обяви пускането на GPT-4.5, за който главният изпълнителен директор

Какво мислят експертите и потребителите за пускането на модела GPT-4.5?

OpenAI разгласи стартирането на GPT-4.5, за който основният изпълнителен шеф Сам Алтман споделя, че ще бъде последният модел без верига на мисълта (CoT).

Компанията сподели, че новият модел „ не е напреднал “, само че към момента е най-големият езиков модел (LLM) с по-висока изчислителна успеваемост. Алтман сподели, че въпреки GPT-4.5 да не разсъждава толкоз добре, колкото други нови оферти на OpenAI като o1 или o3-mini, този нов модел към момента предлага повече човешко държание.

Наблюдатели от промишлеността, доста от които имаха ранен достъп до новия модел, откриха GPT-4.5 за забавен ход от страна на OpenAI, който дава отговор на упованията им за това, което моделът би трябвало да може да реализира.

Професорът от Уортън и специалист по изкуствен интелект Итън Молик написа в обществените медии, че GPT-4.5 е „ доста чудноват и забавен модел “, отбелязвайки, че може да бъде „ необичайно ленив, когато работи върху комплицирани планове “, макар че е „ мощен публицист “.

Съоснователят на OpenAI и някогашен началник на Tesla AI Андрей Карпати означи, че GPT-4.5 му припомня за GPT-4, когато се появи и той видя капацитета на модела. В обява на X Карпати сподели, че с GPT 4.5 „ нещата са малко по-добри, което е ужасно, само че не толкоз добре, колкото бихте очаквали “.

Карпати предизвести, че хората не би трябвало да чакат революционни промени от модела, защото „ не уголемява опциите на модела в случаите, когато разсъждението е значимо (математика, програмиране и т.н.) “.

Други консуматори с ранен достъп също видяха капацитет в GPT-4.5. Изпълнителният шеф на Box Арън Леви сподели в X, че неговата компания употребява GPT-4.5 за добиване на структурирани данни и метаданни от комплицирано корпоративно наличие.

„ Пробивите в ИИ не престават. OpenAI разгласи GPT-4.5 и ще го предоставим на клиентите на Box довечера в Box AI Studio. Тествахме GPT-4.5 в ранен достъп с Box AI върху корпоративни неструктурирани данни и получихме страхотни резултати. По-специално се фокусирахме върху извличането на структурирани данни от комплицирано наличие, което има забележителен бизнес капацитет.

В Box ние прецизно оценяваме моделите за добиване на данни, употребявайки корпоративни набори от данни, в това число CUAD, който съдържа над 510 юридически контракта. Идентифицирахме 17 000 полета за добиване от неструктурирани данни и организирахме провокационен тест, при който GPT-4.5 вярно извлече 19% повече полета от GPT-4o, показвайки усъвършенствана дарба за обработка на контрактна информация.

Тествахме също GPT-4.5 върху по-сложен набор от документи на Box, в това число правни контракти с мултимодално наличие и размер над 200 страници. В тези проби GPT-4.5 непрекъснато превъзхожда GPT-4o във връзка с точността на добиване на основни полета, демонстрирайки своята успеваемост при работата със комплицирани документи.

Като цяло, резултатите от потреблението на GPT-4.5 върху комплицирани корпоративни данни са обнадеждаващи и разкриват нови бизнес благоприятни условия. “

Дори когато първите осиновители откриха, че GPT-4.5 е функционален, въпреки и малко ленив, те бяха скептични по отношение на стартирането му.

Например, видният критик на OpenAI Гари Маркъс назова GPT-4.5 „ непокорен “ на Bluesky.

Изпълнителният шеф на Hugging Face Клемент Деланж разяснява, че затвореният първоначален код на GPT-4.5 го прави „ като себе си “.

Мнозина обаче означиха, че GPT-4.5 няма нищо общо с неговата продуктивност. Вместо това хората се чудеха за какво OpenAI пусна модел, който беше толкоз безценен, че съвсем е недосегаем за използване и не толкоз мощен, колкото останалите модели.

Един консуматор разяснява в X: „ Значи ми казвате, че GPT-4.5 коства повече от o1, само че не се показва толкоз добре в бенчмарковете… Обяснете какво значи това. “

Други консуматори на X са теоретизирали, че високата цена на токена може да има за цел да възпре съперници като DeepSeek „ да усъвършенстват модела 4.5 “.